home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / ietf / urn / urn-archives / urn-ietf.archive.9608 / 000000_owner-urn-ietf _Thu Aug 1 19:23:01 1996.msg next >
Internet Message Format  |  1997-02-19  |  15KB

  1. Received: (from daemon@localhost) by services.bunyip.com (8.6.10/8.6.9) id TAA22791 for urn-ietf-out; Thu, 1 Aug 1996 19:23:01 -0400
  2. Received: from mocha.bunyip.com (mocha.Bunyip.Com [192.197.208.1]) by services.bunyip.com (8.6.10/8.6.9) with SMTP id TAA22782 for <urn-ietf@services.bunyip.com>; Thu, 1 Aug 1996 19:22:57 -0400
  3. Received: from mintaka.lcs.mit.edu by mocha.bunyip.com with SMTP (5.65a/IDA-1.4.2b/CC-Guru-2b)
  4.         id AA23192  (mail destined for urn-ietf@services.bunyip.com); Thu, 1 Aug 96 19:22:54 -0400
  5. Received: from skadhwe.lcs.mit.edu by MINTAKA.LCS.MIT.EDU id aa28913;
  6.           1 Aug 96 19:22 EDT
  7. Received: by skadhwe.lcs.mit.edu; (5.65/1.1.8.2/15Aug95-0306PM)
  8.     id AA09845; Thu, 1 Aug 1996 19:22:43 -0400
  9. Date: Thu, 1 Aug 1996 19:22:43 -0400
  10. Message-Id: <9608012322.AA09845@skadhwe.lcs.mit.edu>
  11. From: Lewis Girod <girod@LCS.MIT.EDU>
  12. To: terry@ora.com
  13. Cc: urn-ietf@bunyip.com
  14. In-Reply-To: <199607291642.MAA06586@services.bunyip.com> (message from Terry
  15.     Allen on Sun, 28 Jul 1996 12:32:18 PDT)
  16. Subject: Re: [URN] re NAPTR, URN-res-req
  17. Sender: owner-urn-ietf@services.bunyip.com
  18. Precedence: bulk
  19. Reply-To: Lewis Girod <girod@LCS.MIT.EDU>
  20. Errors-To: owner-urn-ietf@bunyip.com
  21.  
  22. At 12:32 PM 7/28/96 PDT, Terry Allen wrote:
  23.  
  24. >Much is made here of "hints," which I understand as heuristic instructions
  25. >that the client or intermediary can use to determine how to start 
  26. >the URN resolution process.  I think something like this is 
  27. >essential, but it needs fleshing out.  Can a syntax or format 
  28. >of hints be generalized?  (My guess is that it can't.)  
  29. >Can the semantics of hints be generalized:  "for anything
  30. >written by author={Jane Austen} see the Jane Austen Home Page"?  (I think
  31. >this might be possible for well defined bibliographic data.)
  32.  
  33. This was an area in which we were not very specific.  In our private
  34. discussions while writing this we developed a concept we mean by
  35. ``hints'' which we unfortunately forgot to explain clearly in the
  36. document.  
  37.  
  38. We used the term ``hint'' to mean precisely the data formats used by
  39. the system to transmit to the client information that aids in locating
  40. a document given a URN.  Much of our document was intended to be a set
  41. of general issues and requirements that we thought were critical to
  42. producing a working URN system; for this reason we did not want to
  43. specify formats there.  I don't think coming up with formats is too
  44. difficult; it is more a question of what clients actually understand.
  45. At the time of writing we had envisioned such formats as the proposed
  46. NAPTR and SRV records as possible initial `hint' formats, since if the
  47. NAPTR system was in use this would be the type of data the clients
  48. would be expecting.  It should be stated, however, that we were not
  49. intending hints to solve the sorts of semantics-oriented search
  50. problems you describe; we see this as a higher level of the problem
  51. that should be kept separate from the straight URN->document(s)
  52. mapping problem.
  53.  
  54. >I may also wish to discover all resolvers for a given URN, because
  55. >(especially after the publisher has gone away) some may return a 
  56. >better quality object than others--remember that "sameness" is defined 
  57. >by the publisher or namer, and an URN doesn't necessarily resolve
  58. >to a unique object.  Has this task been considered in either draft?
  59.  
  60. In the models we are considering, this problem would typically be
  61. solved using unofficial hints.  This is because there is an assumption
  62. that the URN in question falls into the domain of some naming
  63. authority, and they are providing (or not) official hints as to where
  64. the URN can be resolved.  They may not provide or even be aware of all
  65. relevant resolvers; for this reason collections of unofficial hints
  66. may be provided by anyone that can direct people to alternate
  67. resolvers.  In the long run unofficial hints are less efficient to
  68. maintain and are in general less certain (the models we consider do
  69. not guarantee that unofficial hints are provided with the accuracy
  70. accorded to official hints), so they should be considered to be
  71. temporary fixes for problematic situations.  In answer to your
  72. question, in such a system all advertised resolvers would be
  73. determinable.
  74.  
  75. >But in time, as NAs disappear, sometimes leaving large messes behind
  76. >them, there will be URNs for which no single authoritative resolver
  77. >exists; this problem is only compounded for hints, which offer fertile
  78. >...
  79. >Thus much of section 4.1 is moot.  One cannot require that there be
  80. >authoritative URN resolution services; there will be simply services.
  81. >Whether they work for you or not is something you'll have to do your
  82. >homework on.  The hints you'll find most valuable may be those
  83. >supplied by third parties, or discovered by your own desktop client
  84. >based on experience; and there may be no correlation with their
  85. >supposed authoritativeness.
  86.  
  87. These concerns are definitely something to think about.  In terms of
  88. naming authorities disappearing, I had envisioned the solution being
  89. for the naming authority to transfer or sell off its namespace to
  90. other entities before going away.  For example, if you have some names
  91. issued by shady.com, they might sell them to you before they go out of
  92. business, at which point you would be responsible for telling the
  93. resolution system where your authoritative server is.  In our model
  94. ``authoritative server'' does not imply much of anything in terms of
  95. authenticity -- it merely is the server that the naming authority
  96. owning the names says is authentic.  This is another place where
  97. unofficial hints come into play; an unofficial hint may give
  98. information that contradicts the ``official'' information from the
  99. ``official'' naming authority.  In the end it is up to the user to
  100. decide who is telling the truth; it is quite possible that the
  101. unofficial hints are written by the author of the eventual resource
  102. (and authenticatable) but to know that you need to know who the author
  103. is, etc.  Note that our ideas of having unofficial hints integrated
  104. into the system do not preclude third party hint systems!  In fact
  105. third party hint systems are a really good idea, but from my
  106. perspective it seems best to also try to integrate them into the
  107. official infrastructure in the interests of fairness (it may not
  108. succeed, of course... :-) ).
  109.  
  110. Another issue that is parallel to this is that the resolution models
  111. being discussed here all try to deal with URNs in groups in order to
  112. cut down on the size of higher levels of the database.  NAPTR does
  113. this in a similar way to the DNS.  The model I tend to think of tends
  114. to assume that the top level of the directory is pretty big, but still
  115. is based on the idea of sending all URNs starting with this prefix to
  116. this particular resolver.  In the end this is a good idea because it
  117. allows changes to be made at a local level rather than having to
  118. bother the top level every time.  This means that the system we are
  119. talking about does not deal with individual URNs under normal
  120. circumstances; they will always be generalized somehow, in my mind
  121. usually through the concept of a naming authority.  Note also that
  122. systems set up this way cannot deal with the semantic content of URNs
  123. because that radically changes the way they are hierarchicalized (For
  124. example, sorting on author and on title produce two very different
  125. search trees...)  Since the data they are storing is really just a
  126. description of generalization, these systems always deal with just one
  127. hierarchy and stick to it.
  128.  
  129. >4.1.2 describes as necessary a Hint Passing Interface, and says
  130. >that hints lie within given naming schemes.  Gosh, this seems
  131. >simplistic.  Why is this a requirement for URN resolution?  Has
  132. >anything of the sort been attempted?  Why must hints be restricted
  133. >to the NA vector ("anything written by author={Jane Austen}")?
  134. >This is not the way we locate most bibliographic information today.  
  135.  
  136. It should be noted that section 4 describes some ideas we had
  137. for a model or framework for URNs, more than it states requirements.
  138. The requirements we wanted to set are in section 2.  
  139.  
  140. >BTW, who owns the URN?  the top-level NA, or the NA responsible for
  141. >actually associating the URN with something?  If I offer resolution
  142. >for your URNs, can you object?  especially if the URN denotes an
  143. >object neither of us owns rights in or that cannot be retrieved?  
  144. >Pseudoexamples: 
  145. >FPI:ISO:+ISO/IEC 8070/RA::A00002/Athens/Acropolis/Erectheum
  146. >PP:944940/Domesday Book/page 18
  147. >USArchives:Nixon/tape/18.5-min-gap
  148.  
  149. Interesting question.. in the end I suppose this is a legal issue, but
  150. in my opinion I would say no.  Just because a URN is resolved to a
  151. location does not imply that (a) the location serves it to you, or (b)
  152. the location admits that it exists.  I suppose that certain types of
  153. resolution process might be proprietary, and in that case executing
  154. the algorithm might be illegal even if it was independently derived.
  155. I have never agreed with this, but that probably has little bearing on
  156. reality.
  157.  
  158. >4.2.1 "There is a need for an effective model of name delegation."
  159. >This form of words, "there is a need", is becoming all too common.
  160. >What is the need?  if the need is not satisfied (and it never
  161. >will be fully satisfied in practice), does URN resolution become 
  162. >impossible or merely messy?
  163.  
  164. Well, to the degree that the need is not satisfied things may get
  165. messy and/or people may get annoyed.  I don't think it is the end of
  166. the world, nor is it entirely avoidable, but I do believe that certain
  167. design choices can make a difference.  In this section I was trying to
  168. analyse exactly what people want out of a name and how that interferes
  169. with the desired property of longevity.  The essential problem is that
  170. in the short term people dont generally care about longevity so they
  171. do things that may screw them later.  The fact is that if what gets
  172. built is pretty much good enough, people will use it even if it doesn't
  173. really do quite what they want, especially if it is the first thing 
  174. that came along and everybody's browser understands it.  For that reason
  175. I think that setting a few design limitations that happen to prevent
  176. certain types of predictable disaster might be a good thing overall.
  177.  
  178. >4.2.2 states some obvious things that will be under the control of
  179. >NAs, which will do as they please.  The behavior of NAs is not
  180. >within scope for the IETF, so long as they don't overlap each
  181. >other's namespaces.
  182.  
  183. True, but these constraints only affect them if they choose to utilize
  184. the system that is being described in section 4.  If they want to do
  185. something else, they are free to escape to their own entirely separate
  186. and unregulated resolution system.  (Note that this is a problem for
  187. NAPTR as well, although it is not explicitly stated.  There are
  188. namespaces which do not lend themselves to NAPTR-style decomposition
  189. and thus would need to be escaped.)  The question is, how restrictive
  190. is this really?  I have been thinking a lot about this and have found
  191. little in the way of problematic counterexamples.
  192.  
  193. >But this admittedly "vague sketch" of strategies is simply too vague, 
  194. >as it relies on the concept of hints but doesn't describe them, and 
  195. >ignores the power of supplying as input into the URN resolution system 
  196. >ancillary information about the URN (hints in reverse, so to speak).
  197.  
  198. True.  Our omission of an explanation of hints has caused a great deal
  199. of confusion, which this reply has hopefully addressed to a degree.
  200. Since we did not have a clear technical plan at the time of writing we
  201. did not want to do into a lot of detail; we hoped to instead get out
  202. some ideas we were plaing with and see what sort of reactions were
  203. generated.  As for the idea of `hints in reverse', the URN community
  204. should decide if this is within the scope of our problem or whether we
  205. want to declare it outside.  My opinion is that it is outside; it
  206. widens the problem and makes the primary technique for resolution
  207. (i.e. precomputed lexical generalization of URNs) impossible.
  208.  
  209. In any case, thanks a lot for the comments.  Yours are the first to
  210. address any of the ideas in section 4.  I have been continuing to work
  211. on those ideas, in particular the stuff relating to canonical forms.
  212. Following this message I am forwarding a pointer to a small
  213. explanation of how various naespaces might be canonicalized on the
  214. client side enough to be taken apart by very simple rules.  The
  215. canonicalization is done by a simple translation program that takes a
  216. little ``program'' as input.  The idea is to rearrange the URN at the
  217. beginning so that the hierarchy goes in one consistent direction; the
  218. theory is that after the name is canonicalized the rest of the
  219. resolution can be done with very simple ``rules''.
  220.  
  221. Essentially, where NAPTR allows arbitrary rewrite patterns, the
  222. simplified rules allow only a few very simple moves, removing
  223. characters from the front of the canonicalized string and copying them
  224. or replacing them with specified strings.  This way most of the data
  225. driving the resolution are in this simplified format, which makes it
  226. easier to handle and easier to specify from above.  Under such a
  227. system, a name scheme designer can enforce certain policies about the
  228. format and semantics of the names under that scheme, whereas according
  229. to the original NAPTR model the top-level name scheme design had no
  230. impact on the structure underneath.
  231.  
  232. Such a modified NAPTR resolution mechanism will be able to resolve a
  233. very specific subset of all possible namespaces, and the rest will be
  234. escaped to other resolution mechanisms.  The main difference here (as
  235. far as I can tell) is that using the simplified rules it becomes more
  236. obvious what naming schemes are possible and which are not.  It is not
  237. clear that this modification results in any significant reduction in
  238. the universe of resolvable name schemes.  In fact, NAPTR is not well
  239. suited to many types of namespaces.  For example, a namespace of MD5
  240. digests of documents could not efficiently be resolved by NAPTR, nor
  241. can it be efficiently resolved by this modified system.  One name
  242. space that the original NAPTR plan can resolve that the modified one
  243. can't is a namespace in which there is no pre-defined hierarchy.  For
  244. example, generalization can be based on flags:
  245.  
  246.   URN:flags:girod#paper.ps#about-translation#about-urns
  247.  
  248. contains several #-delimited flags that could be matched (for example,
  249. all URNs of that type containing my name go to my resolver, etc.)
  250. However, for a number of reasons, this is not currently a useful way
  251. of structuring URNs, and if it becomes useful it seems reasonable to
  252. build a separate resolution mechanism.
  253.  
  254.